排序方式: 共有2630条查询结果,搜索用时 175 毫秒
991.
乔建忠 《现代图书情报技术》2009,(Z1)
提出一种以动态知识库为指导的主题爬虫的设计方法,目的是克服传统的基于本体的主题爬虫的领域局限性和缺乏指导用户功能的不足;通过知识库的不断完善更好地指导爬虫找到相关网页.其中涉及的主要问题:构建动态知识库、计算网页相关度和判断相关链接. 相似文献
992.
基于Nutch的Web网站定向采集系统 总被引:3,自引:0,他引:3
在对目前具有代表性的开源网络抓取软件Nutch、Heritrix、WCT、Web-Harvest进行比较分析的基础上,提出基于Nutch的Web网站定向采集系统,并对种子站点的选取、抓取过程管理、网页去噪、新种子站点的发现等关键问题进行重点探讨。 相似文献
993.
以现有Web Archive项目为案例,初步分析这些项目中所采用的检索系统架构以及它们如何应对在海量数据中快速发现信息、呈现信息的挑战,以期从系统架构的角度来探析Web Archive检索系统的性能和效率,为相关研究机构、人员提供参考。 相似文献
994.
"网络信息资源保存的理论与方法研究"专辑序 总被引:2,自引:0,他引:2
吴振新 《现代图书情报技术》2009,(1)
随着信息技术的飞速发展,网络已经成为主要的信息媒体,网络上存在大量有重要价值的信息,成为人类文化遗产的重要组成部分,因此网络信息资源保存即Web Archive成为非常重要和急迫的要求.保存网络信息资源,既是图书馆对于社会文明的传承,也是其保存功能的自然延伸,成为图书馆责无旁贷的任务. 相似文献
995.
Web Archive的采集策略研究 总被引:4,自引:0,他引:4
通过总结目前国际上Web Archive中常用的三种采集策略:完整性采集、选择性采集和混合型采集,对比分析各种采集策略的特点、关键问题和代表性的项目,最后分析选择采集策略需要考虑的关键因素,并提出一般性的建议。 相似文献
996.
结合面向信息服务机构的嵌人式NSTL资源集成服务系统实践,讨论整合过程中系统互操作和结果融合的方法,并对相关实现技术进行说明,最后给出系统性能测试的结果,验证所提方法的可行性. 相似文献
997.
介绍新版ISI Web of Knowledge平台在2008年10月系统升级后的新增功能,重点推介Scientific WebPlus、Citation Map和ResearcherID的使用方法及在科研中的利用,为科研人员和图书情报人员使用新版ISI Web of Knowledge平台提供参考. 相似文献
998.
数字图书馆服务登记系统的功能及应用 总被引:1,自引:0,他引:1
数字图书馆服务登记系统允许机器或人发现可用数字图书馆服务,定位这些服务,并获取配置信息与服务进行交互.数字图书馆服务登记系统具有服务发布,服务检索、监测和评估、支持服务工作流管理等功能.对具有代表性的服务登记系统IESR、OCKHAM-DLSR、myGrid和OFSR以及相关标准ISO2146进行分析,在此基础上提出数字图书馆服务登记系统发展需要解决的问题以及相应对策,以期为我国数字图书馆界资源与服务登记系统的建设提供借鉴. 相似文献
999.
为了将长期保存的网络信息资源提供给用户利用,保存机构需要对这些资源进行一定的组织与质量控制。文章介绍了网络资源保存编目研究的发展现状,介绍了目前几种常用的编目方法:延续传统编目方法、基于web2.0标签技术的信息组织方法、基于大规模Web archive自动编目方法。并对两个新型的编目系统进行了深入的剖析:一个是瑞士的电子资源长期保存工程e-Helvetica,它将图书馆编目系统与长期保存系统的摄入流程进行集成整合,利用编目系统对长期保存资源进行组织与控制;另外一种是新加坡的网页标注系统WAWI,借鉴web2.0标签技术为长期保存系统中的网络资源添加标签,实现对资源内容语义层面上的控制。希望能为国内网络信息资源保存的相关研究与实践提供一些参考。该文为2009年第七期“网络信息资源保存”专题文章之一。 相似文献
1000.
国际图书馆界开放获取的研究与实践——75届国际图联大会开放获取论文综述 总被引:1,自引:0,他引:1
2009年国际图联(IFLA)第75届大会比以往更加重视开放获取(OA)问题,至少有三个专业委员会的主题为OA。在OA方面,大会报告和论文主要侧重在0A的政策与机制、OA的问题与挑战、OA的实践进展等几个方面。 相似文献